در بازار انرژی الکتریکی، قیمت مهم ترین سیگنال برای همه واحد های تولید (GenCos) می باشد. هر GenCo به دنبال پیشنهاد قیمتی است که سود خود را حداکثر سازد. از این رو در این مقاله، یک الگوریتم آموزشی نوین بر پایه هوشمندسازی نحوه قیمت دهی GenCos ، به منظور یادگیری استراتژی بهینه GenCos و رسیدن به نقطه تعادل نش ارائه می گردد. در این میان بهره بردار مستقل بازار ISO)) نیز با اعمال قیود شبکه تعادل را برقرار می سازد. به منظور بررسی تاثیر استراتژی اتخاذ شده بر وضعیت رقابت بازار، از شاخص ضریب آنتروپی استفاده کردیم. مقدار این شاخص در پایان کار نشان می دهد که GenCo ها توانسته اند در حالت بدون در نظر گرفتن محدوده مجاز تولید و انتقال نسبت به حالت با در نظر گرفتن محدوده مجاز تولید و انتقال، سود خود را بیشتر و بازار را انحصاری تر کنند. نتایج شبیه سازی کارآیی الگوریتم یادگیری پیشنهادی را نشان می دهد. شبکه مورد مطالعه، برگرفته شده از بازار Nord Pool می باشد.